OECD ülkelerinde öğretmenlerin ders kitabını
yardımcı
kaynak olarak kullanımı
Bu Proje için veri kümesi http://stats.oecd.org/#
kaynağındaki OECD istatistiklerinden “Measuring Innovation in Education”
(Eğitimde Girişimciliği Ölçme) bölümünden alınmıştır. Türü csv
dosyası indirilecek şekilde seçildiği halde ancak uzantısı .txt olarak yüklenmiştir.
Bu verilerin okunması sırasında “veri içinde NULL
değer olduğu” R hatası alınmıştır. Bunun üzerine read.table komutuna skipNul = TRUE parametresi
eklenmiştir.
> innovedu
<- read.table(file = "innovation
as change in classrooms.txt",header=TRUE,skipNul = TRUE,sep = ",")
> str(innovedu)
'data.frame': 3846 obs. of 1 variable:
$
ÿşLOCATION..Country...IND...Indicator...PER...Period...GRD...Grade...FLD...Field...MSR...Measure...Value...Flag.Codes...Flags.:
Factor w/ 3846 levels
"AUS,\"Australia\",\"10CAU\",\"Percentage of students with computers available to use
and change over time\",\"CHG\",\"Change in"| __truncated__,..:
55 56 1471 1472 1867 1868 2025 2026 2239 2240 ...
> library(dplyr)
> glimpse(innovedu)
Observations: 3,846
Variables: 1
$ ÿşLOCATION..Country...IND...Indicator...PER...Period...GRD...Grade...FLD...Field...MSR...Measure...Value...Flag.Codes...Flags. <fctr> ...
Sonucunda yukarıda da görüldüğü gibi 3,846 kayıt doğru
olarak okunmuş, ancak nitelik sayısı bir olarak tüm kayıdı
bir değer şeklinde görmüştür. Okumada sorun çıktığı için OECD formatı ile R
okuma formatı örtüşmediğini farkederek için kendimiz
bazı denemeler yaptık. Txt dosyasında bulunan “”” ları değiştirme, vb. sorunları çözemeyince hocamıza
başvurduk. Berk hocamız OECD txt dosyasını Excel
formuna dönüştürdü. Böylece R a kayıt ve nitelik sayısı read.table
doğru olarak okuduk.
> setwd("D:/R")
> dir()
> install.packages("readxl")
> library("readxl", lib.loc="~/R/win-library/3.3")
> oecdoku
<- readxl::read_excel(path =
"OECDdata.xlsx")
> oecdoku
# A tibble: 3,846 × 15
LOCATION Country IND
<chr> <chr> <chr>
1 AUS Australia 5CLAT
2 AUS Australia 5CLAT
3 HUN Hungary 5CLAT
4 HUN Hungary 5CLAT
5 ITA Italy 5CLAT
6 ITA Italy 5CLAT
7 JPN Japan 5CLAT
8 JPN Japan 5CLAT
9 NLD Netherlands 5CLAT
10 NLD Netherlands 5CLAT
# ... with 3,836
more rows, and 12 more variables:
# Indicator <chr>, PER <chr>, Period <chr>, GRD <chr>,
#
Grade <chr>, FLD <chr>,
Field <chr>, MSR <chr>, Measure <chr>,
#
Value <dbl>, `Flag
Codes` <chr>, Flags <chr>
Veri setimizi okuttuktan sonra, sadece Türkiye
verileri üzerinde çalışmayı düşündüğümüz için öncelikle Türkiye ye ilişkin kayıtları
oecdTUR a aldık. Fakat kayıt sayısı az olduğu için daha
sonra vazgeçtik, tüm veri setine geri döndük.
> install.packages("readxl") %<% library(readxl
Installing package into ‘C:/Users/alev/Documents/R/win-library/3.3’
(as ‘lib’ is unspecified)
trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.3/readxl_0.1.1.zip'
Content type 'application/zip' length 801948 bytes (783 KB)
downloaded 783 KB
package ‘readxl’ successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\alev\AppData\Local\Temp\Rtmp4GoI2u\downloaded_packages
>
> install.packages("readxl")library(readxl
Error: unexpected symbol in
"install.packages("readxl")library"
>
> setwd("D:/R")
> dir()
[1]
"~$eğitimi gün 2.docx"
[2]
"~$eğitimi.docx"
[3]
"~WRL0674.tmp"
[4]
"040217"
[5]
"040217 2"
[6]
"2.R"
[7]
"ab2017-katilimcilar.csv"
[8]
"ab2017-katilimcilar.xlsx"
[9]
"ab2017-katilimcilar2.csv"
[10] "Aksaray Genelinde Seçim Sonuçları.pdf"
[11] "alıştırma 2.R"
[12] "Alıştırma gün 1.docx"
[13] "baslangıcbitis
zamanı.R"
[14] "betikscript.R"
[15] "çalışma 040217"
[16] "deneme2.R"
[17] "deneme3.R"
[18] "dokuman_temel_alistirma.html"
[19] "dplyr
Eğitim Dökümanı.pdf"
[20] "education
and earnings.txt"
[21] "function
1.R"
[22] "housing.data.txt"
[23] "innovation
as change in classrooms
01.txt"
[24] "innovation
as change in classrooms
02.txt"
[25] "innovation
as change in classrooms TIRNAKYOK.txt"
[26] "innovation
as change in classrooms TURKEY.txt"
[27] "innovation
as change in classrooms.txt"
[28] "misafirgiriş.pdf"
[29] "Mustafa Baydoğan"
[30] "OECD datamız.xls"
[31] "OECD indicator.docx"
[32] "OECDdata.RData"
[33] "OECDdata.xlsx"
[34] "ornek.Rmd"
[35] "pca.R"
[36] "Projemiz için notlar.docx"
[37] "R console
g?n 3.Rhistory"
[38] "R eğitimi gün 2.docx"
[39] "R eğitimi gün 3 Veri masdenciliği nedir.docx"
[40] "R eğitimi.docx"
[41] "R ile Hazır Veri Bilimcisi -
ggplot2.pdf"
[42] "Usak plot.png"
[43] "veriokuma.r"
> install.packages("readxl")
Installing package into ‘C:/Users/alev/Documents/R/win-library/3.3’
(as ‘lib’ is unspecified)
trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.3/readxl_0.1.1.zip'
Content type 'application/zip' length 801948 bytes (783 KB)
downloaded 783 KB
package ‘readxl’ successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\alev\AppData\Local\Temp\Rtmp4GoI2u\downloaded_packages
> library("readxl", lib.loc="~/R/win-library/3.3")
> oecdoku
<- readxl::read_excel(path =
"OECDdata.xlsx")
> oecdoku
# A tibble:
3,846 × 15
LOCATION Country IND
<chr> <chr>
<chr>
1 AUS Australia 5CLAT
2 AUS Australia 5CLAT
3 HUN Hungary 5CLAT
4 HUN Hungary 5CLAT
5 ITA Italy 5CLAT
6 ITA Italy 5CLAT
7 JPN Japan 5CLAT
8 JPN Japan 5CLAT
9 NLD Netherlands 5CLAT
10 NLD Netherlands 5CLAT
# ... with 3,836
more rows, and 12 more variables:
# Indicator <chr>, PER <chr>, Period <chr>, GRD <chr>,
#
Grade <chr>, FLD <chr>,
Field <chr>, MSR <chr>, Measure <chr>,
#
Value <dbl>, `Flag
Codes` <chr>, Flags <chr>
> oecdoku
%>% filter(Country == "Turkey")
# A tibble: 56 ×
15
LOCATION Country
IND
<chr>
<chr> <chr>
1 TUR Turkey 6RRAT
2 TUR Turkey 6RRAT
3 TUR Turkey 6EAAT
4 TUR Turkey 6EAAT
5 TUR Turkey 6RRAT
6 TUR Turkey 6RRAT
7 TUR Turkey 6EWAT
8 TUR Turkey 6EWAT
9 TUR Turkey 6ODAT
10 TUR Turkey 6ODAT
# ... with 46 more rows, and
12 more variables: Indicator <chr>,
#
PER <chr>, Period
<chr>, GRD <chr>,
Grade <chr>, FLD <chr>,
# Field <chr>, MSR <chr>, Measure <chr>, Value <dbl>, `Flag
# Codes` <chr>, Flags <chr>
> oecdTUR
<- oecdoku %>% filter(Country
== "Turkey")
> oecdTUR
Tüm OECD verileri içinde filtreleme yapmaya karar
verdik. Daha sonra tüm verinin içinden ders kitabı ile ilgili olanları oecdoku içine çekip onun üzerinde çalışmaya karar verdik. IND
niteliği iki tür kategori içeriyor: 8UTPR öğretmenlerin ders materyallerini
öğretme sürecine temel kaynak olarak kullanması yüzdesi, 8UTSR öğretmenlerin
ders materyallerini öğretme sürecine yardımcı kaynak olarak kullanması yüzdesi.
8UTPR: Percentage of students whose teachers use textbooks
as a basis for instruction and change over time.
8UTSR: Percentage of students whose teachers use textbooks
as a supplementary resource
and change over time.
> oecdoku %>% filter(IND
== "8UTPR" | IND == "8UTSR") # A tibble: 392 × 15 LOCATION Country IND <chr> <chr>
<chr> 1
AUS
Australia 8UTPR 2
AUS
Australia 8UTPR 3
AUT
Austria 8UTPR 4
AUT
Austria 8UTPR 5
CZE Czech Republic 8UTPR 6
CZE Czech Republic 8UTPR 7
DNK
Denmark 8UTPR 8
DNK
Denmark 8UTPR 9
DEU
Germany 8UTPR 10
DEU
Germany 8UTPR # ... with 382 more rows, and 12 more variables: Indicator <chr>, # PER <chr>,
Period <chr>, GRD
<chr>, Grade <chr>,
FLD <chr>, # Field
<chr>, MSR <chr>,
Measure <chr>,
Value <dbl>, `Flag # Codes`
<chr>, Flags <chr> |
|
Filtrelemede
‘ve’ ile birleştirmek istedim, ama çalışmadı. Neden & çalışmadı??? |
|
|
Akademik Bilişim 2017,
Aksaray Üniversitesi, Aksaray
R ile Veri Analizi
Eğitimi Projesi
Alev
Elçi
Ömer
Faruk Yılmaz